맞춤형 의학연구 애플리케이션을 위한 개발 환경 구축
ANPANMAN Co.,Ltd.
Jinseob Kim
October 26, 2018
Executive Summary
맞춤형 의학연구 애플리케이션을 위해
Rstudio와 shiny server가 설치된 Docker 이미지를 만들고 이것을 Docker swarm을 이용해 배포함으로써 서버의 종류와 갯수에 구애받지 않는 마이크로서비스 아키텍처(microservice architecture)를 구축하였으며
동적 프록시 서버(dynamic proxy server) 프로그램인 Traefik 을 이용하여 서비스가 추가될 때 마다(ex: 홈페이지, Jupyter) 이에 맞추어 https 보안이 적용된 subdomain 주소를 부여하였습니다.
흔히 이용되는 의학통계 방법들을 ShinyApps 로 만들어 위의 환경에 배포하였으며, 모든 앱에는 논문/보고서용 테이블과 그림을 위해 데이터 라벨(label) 정보를 적용하였습니다.
1. 마이크로서비스 아키텍처
여행용 파우치 장단점
장점
깔끔하다.
치우기 쉽다.
다른 가방으로 옮기기 쉽다.
가방 종류에 구애받지 않는다.
단점
실제 쓸 수 있는 공간이 줄어든다.
분리해서 넣기 귀찮다.
물건 찾을 때 지퍼를 한번 더 열어야 된다.
Microservice 장단점
장점
깔끔하다.
삭제가 쉽다.
다른 컴퓨터에 재설치 쉽다.
컴퓨터/서버 종류에 구애받지 않는다.
단점
실제 쓸 수 있는 용량이 줄어든다.
서비스마다 모듈 만들기 귀찮다.
성능저하 우려
가상머신(Virtual machine) 활용이 대표적.
docker run --rm -d -p 3838:3838 -p 8787:8787 \
-e USER=js -e PASSWORD=js -e ROOT=TRUE\
jinseob2kim/docker-rshiny
- –rm -d : 실행 중지시 지움(–rm), 백그라운드 실행(-d)
- 호스트의 3838포트를 이미지의 3838포트(
shiny server)와 연결, 8787포트를 8787포트(rstudio server)에 연결
- 유저 생성 : js/js, 루트 권한
- Docker hub 주소 : jinseob2kim/docker-rshiny
manger_ip = $(123.456.789.10)
# Init Docker Swarm mode: In manager node
docker swarm init --advertise-addr $manager_ip
# Get Swarm tokens
worker_token=$(docker swarm join-token worker -q)
# Join worker nodes: In worker node
docker swarm join --token $worker_token $manager_ip:2377
https://www.youtube.com/watch?v=2RQbpnRxx-Y
주의
연결 가능한 서버끼리만 묶을 수 있다.
AWS끼리(O), Azure끼리(O), Digitalocean끼리(O)
AWS와 Azure(X), AWS와 Digitalocean(X)
AWS(Azure, Digitalocean)와 자체서버(X)
서비스 실행: rstudio & shiny server
자체적으로 이미지 docker-rshiny 를 만들어 사용하였다.
docker service create \
--name rshiny \
--publish 8787:8787 \
--publish 3838:3838 \
-e USER=js -e PASSWORD=js -e ROOT=TRUE \
jinseob2kim/docker-rshiny
Manger node와 worker node 주소 모두에서 8787 포트로 rstudio server를, 3838 포트로 shiny server를 실행할 수 있다.
추가: tensorflow docker 실행
docker service create \
--name tf \
--publish 8888:8888\
tensorflow/tensorflow
사용자가 늘어나면?
docker service scale 명령어 이용
docker service scale rshiny=2
다시 줄이기
docker service scale rshiny=1
base=https://github.com/docker/machine/releases/download/v0.15.0 &&
curl -L $base/docker-machine-$(uname -s)-$(uname -m) >/tmp/docker-machine &&
sudo install /tmp/docker-machine /usr/local/bin/docker-machine
docker-machine version
예: Digital ocean - manager 이름으로 서버 생성.
export DIGITALOCEAN_ACCESS_TOKEN=<YOUR_DIGITALOCEAN_ACCESS_TOKEN>
export DIGITALOCEAN_IMAGE="ubuntu-18-04-x64"
export DIGITALOCEAN_REGION="sgp1"
echo "### Creating manager nodes ..."
for c in {1..1} ; do
docker-machine create \
--driver digitalocean \
--digitalocean-access-token $DIGITALOCEAN_ACCESS_TOKEN \
--digitalocean-image $DIGITALOCEAN_IMAGE \
--digitalocean-region $DIGITALOCEAN_REGION \
--digitalocean-size "s-2vcpu-4gb" \
manager$c &&\
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
AWS
export AWS_ACCESS_KEY_ID=<YOUR_AWS_ACEESS_KEY_ID>
export AWS_SECRET_ACCESS_KEY=<YOUR_AWS_SECRET_ACCESS_KEY>
export AWS_INSTANCE_TYPE="t2.micro"
export AWS_INSTANCE_REGION="ap-northeast-2"
export AWS_SECURITY_GROUP="launch-wizard-2"
export AWS_VPC_ID=<YOUR_AWS_VPC_ID>
export AWS_ZONE=c
for c in {1..1} ; do
docker-machine create \
--driver amazonec2 \
--amazonec2-access-key $AWS_ACCESS_KEY_ID \
--amazonec2-secret-key $AWS_SECRET_ACCESS_KEY \
--amazonec2-region $AWS_INSTANCE_REGION \
--amazonec2-vpc-id $AWS_VPC_ID \
--amazonec2-open-port 3838 \
--amazonec2-open-port 8787 \
--amazonec2-open-port 8000 \
--amazonec2-open-port 8080 \
--amazonec2-open-port 2377 \
--amazonec2-open-port 7946 \
--amazonec2-open-port 7946/udp \
--amazonec2-open-port 4789 \
--amazonec2-open-port 4789/udp \
--amazonec2-open-port 8888 \
--amazonec2-open-port 80 \
--amazonec2-open-port 443 \
manager$c && \
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
AZURE
export sub=<YOUR_AZURE_SUBSCRIPTION_VALUE>
for c in {1..1} ; do
docker-machine create \
--driver azure \
--azure-location "koreacentral" \
--azure-size Standard_B1s \
--azure-subscription-id $sub \
--azure-open-port 3838 \
--azure-open-port 8787 \
--azure-open-port 8000 \
--azure-open-port 8080 \
--azure-open-port 2377 \
--azure-open-port 7946 \
--azure-open-port 7946/udp \
--azure-open-port 4789 \
--azure-open-port 4789/udp \
--azure-open-port 8888 \
--azure-open-port 80 \
--azure-open-port 443 \
manager$c && \
docker-machine ssh manager$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
묶을 서버 추가오기 : Worker node
export DIGITALOCEAN_SIZE="s-1vcpu-1gb"
echo "### Creating worker nodes ..."
for c in {1..1} ; do
docker-machine create \
--driver digitalocean \
--digitalocean-access-token $DIGITALOCEAN_ACCESS_TOKEN \
--digitalocean-image $DIGITALOCEAN_IMAGE \
--digitalocean-region $DIGITALOCEAN_REGION \
--digitalocean-size $DIGITALOCEAN_SIZE \
worker$c && \
docker-machine ssh worker$c "adduser js --gecos 'First Last,RoomNumber,WorkPhone,HomePhone' --disabled-password && sh -c 'echo js:js | sudo chpasswd' && usermod -aG sudo js"
done
manager1 과 worker1 노드를 docker swarm를 활용하여 묶자.
# Get IP from leader node
leader_ip=$(docker-machine ip manager1)
# Init Docker Swarm mode
echo "### Initializing Swarm mode ..."
eval $(docker-machine env manager1)
docker swarm init --advertise-addr $leader_ip
# Swarm tokens
manager_token=$(docker swarm join-token manager -q)
worker_token=$(docker swarm join-token worker -q)
# Joinig manager nodes
echo "### Joining manager modes ..."
for c in {1..1} ; do
eval $(docker-machine env manager$c)
docker swarm join --token $manager_token $leader_ip:2377
done
# Join worker nodes
echo "### Joining worker modes ..."
for c in {1..1} ; do
eval $(docker-machine env worker$c)
docker swarm join --token $worker_token $leader_ip:2377
done
# Clean Docker client environment
echo "### Cleaning Docker client environment ..."
eval $(docker-machine env -u)
- 도메인 추가: *.DOMAINNAME
도메인 설정 CNAME에 ** *.DOMAINNAME**를 추가해야 된다.

- Traefik 용 network 만들기
eval $(docker-machine env manager1)
DOMAINNAME="anpanman.co.kr"
# Create network for swarm
docker network create --driver=overlay traefik-net
- Let’s Encrypt 설정
# For Let's Encrypt
docker-machine ssh manager1 "DOMAINNAME=anpanman.co.kr && \
mkdir /home/js/opt && \
mkdir /home/js/opt/traefik && \
cd /home/js/opt/traefik && \
touch acme.json && chmod 600 acme.json && \
wget -O traefik.toml https://raw.githubusercontent.com/jinseob2kim/swarm-setting/master/opt/traefik/traefik.toml"
- Run Traefik
# Create traefik service
docker service create \
--name traefik \
--constraint=node.role==manager \
--publish 80:80 --publish 443:443\
--mount type=bind,source=/var/run/docker.sock,target=/var/run/docker.sock \
--mount type=bind,source=/root/acme.json,target=/acme.json \
--mount type=bind,source=/root/traefik.toml,target=/traefik.toml \
-e DO_AUTH_TOKEN=$DIGITALOCEAN_ACCESS_TOKEN \
-l traefik.port=8080 \
-l traefik.frontend.rule=Host:monitor.$DOMAINNAME\
--network traefik-net \
traefik \
--logLevel=INFO \
--docker \
--docker.swarmMode \
--docker.watch \
--docker.domain=$DOMAINNAME
https://monitor.anpanman.co.kr 에서 dashboard를 볼 수 있다.
서비스 재실행: rstudio & shiny server
Traefik 를 적용하여 재실행하자.
docker service create \
--name rshiny \
--label traefik.shiny.port=3838 \
--label traefik.rstudio.port=8787 \
--label traefik.shiny.frontend.rule="Host:app.anpanman.co.kr" \
--label traefik.rstudio.frontend.rule="Host:server.anpanman.co.kr" \
-e USER=js -e PASSWORD=js -e ROOT=TRUE \
--network traefik-net \
jinseob2kim/docker-rshiny
https://server.anpanman.co.kr 에서 ’rstudio server’를, https://app.anpanman.co.kr 에서 ’shiny server’를 실행할 수 있다.
3. 의학연구용 ShinyApps 만들기
주 활용 패키지
데이터: data.table, DT
통계분석: tableone, epiDisplay, survival, geepack, lme4, plotROC, pROC
Plot: ggplot2, GGally, svglite
패키지: devtools, roxygen2
Shiny: shinycustomloader, shiny.i18n
library(DT)
datatable(iris, extension= "Buttons",
options = list(dom = '<lf<rt>Bip>', lengthMenu = list(c(10, 25, -1), c('10', '25', 'All')), pageLength = 10,
buttons = list('copy', 'print',
list(extend = 'collection',
buttons = list(list(extend = 'csv', filename= "table"),
list(extend = 'excel', filename= "table"),
list(extend = 'pdf', filename= "table")
),
text = 'Download')
)
)
) %>%
formatStyle('Sepal.Length', fontWeight = styleInterval(5, c('normal', 'bold'))) %>%
formatStyle(
'Sepal.Width',
color = styleInterval(c(3.4, 3.8), c('white', 'blue', 'red')),
backgroundColor = styleInterval(3.4, c('gray', 'yellow'))
) %>%
formatStyle(
'Petal.Length',
background = styleColorBar(iris$Petal.Length, 'steelblue'),
backgroundSize = '100% 90%',
backgroundRepeat = 'no-repeat',
backgroundPosition = 'center'
) %>%
formatStyle(
'Species',
transform = 'rotateX(45deg) rotateY(20deg) rotateZ(30deg)',
backgroundColor = styleEqual(
unique(iris$Species), c('lightblue', 'lightgreen', 'lightpink')
)
)
앱 실행 중 로딩 보여주기.
실행이 오래걸리는 앱일 때 필요.

Label
데이터의 변수명, 값 \(\neq\) 테이블/그림의 변수명, 값
Label data 생성하고 통계결과와 그림에 적용: 자체 패키지

Main results
- Regression, logistic regression, cox :
epiDisplay 패키지 기반으로 결과테이블 생성
library(epiDisplay)
model0 <- glm(case ~ induced + spontaneous, family=binomial, data=infert)
logistic.display(model0, crude = T, crude.p.value = T)
## Log-likelihood = -139.806
## No. of observations = 248
## AIC value = 285.612
Plot
GGally : ggpair 함수로 변수 비교
svglite: svg 포맷으로 그림 저장하여 ppt에서 수정 가능.
Kaplan meire plot: ggkm 패키지 기반으로 자체 패키지 사용

Q & A